理财/管理智城物语
打印logo打印本文章电邮logo字体:
分享:
马斯克xAI新模型Grok-3,能否撼动OpenAI领先地位?
方展策
作者:方展策评论评论:点击率点击率:

发表时间: 2025-02-21 17:08:36

作者介绍

少年时,曾研习 Geographic Information System,可惜学无所成,侥幸毕业。成年后,误打误撞进入传媒圈子,先后在印刷、电子、网络媒体打滚,略有小成。中年后,修毕信息科技硕士,眼界渐扩,决意投身初创企业,窥探不同科技领域。近年,积极钻研数据分析与数码策略,又涉足 Location Intelligence 开发项目;有时还会抽空执教鞭,既可向他人分享所学,亦可鞭策自己保持终身学习。

   继DeepSeek R-1后,全球首富马斯克旗下AI初创xAI,也发表了具有思考推理能力的AI模型“Grok-3”。xAI宣称,在数学、科学、编程三大基准测试中,Grok-3表现超越包括OpenAI GPT-o4在内的既有模型;马斯克更豪言,它是“地球上最聪明的AI模型”。究竟这家成立不到两年的初创,技术上是否已追上领头羊OpenAI?Grok-3的出现对AI市场竞争又会带来什么影响?


xAI一年半内推出三代AI模型


   埃隆·马斯克(Elon Musk)于2023年7月创立xAI,摆明车马是要挑战OpenAI;同年11月,已推出第一代Grok,可见其研发能力之强。Grok使用马斯克旗下社交媒体平台X(前称Twitter)的贴文进行数据训练;回复用户问题时,更实时从X平台上寻找相关贴文来生成答案,这使得它能快速回应时事问题,甚至回答其他AI避之不及的敏感话题,展现出与众不同的“叛逆”个性。


Grok-3网上直播发表会开首的背景上,显示xAI的使命是“了解宇宙”。(翻摄X.com@xai的官方影片)


   2024年3月,xAI释出初代模型的强化版Grok 1.5,训练数据量增加至3,140亿项参数;同年8月推出第二代模型Grok 2,兼具图像与文本生成能力。沉寂半年后,xAI于2025年2月18日透过网上直播发表第三代模型Grok-3,最高峰时有超过200万人同时观看。


Grok-3提供4个不同版本模型


   在创建模型的首阶段,xAI使用内置10万颗NVIDIA H100芯片的超级计算机Colossus,花了122天制造出Grok-3基础模型;进入第二阶段,xAI再花92天,将Colossus的AI芯片倍增至20万颗,进一步提升Grok-3的运算力。马斯克表示,Grok-3透过大量合成数据进行训练,懂得不断反省思考和修正错误,以提高逻辑一致性。


   Grok-3采用多模型架构,设有4个不同版本:基本版的Grok-3、较小版本的Grok-3 mini、具思考推理能力的Grok-3 Reasoning、以及较小型的推理模型Grok-3 mini Reasoning。根据xAI的内部测试,Grok-3在数学推理(AIME高中竞赛数学标准)、科学知识(包含博士级试题)、编程能力(LeetCode编程练习题)上,表现均优于OpenAI GPT-4o、Google Gemini 2 Pro、Claude 3.5 Sonnet、以及DeepSeek-V3。


兼具实时思考与自主创作能力


   除基准测成绩优异外,Grok-3还具备实时思考与自主创作能力。在网上直播中,xAI团队要求Grok-3绘制一幅3D动画图,模拟火箭从地球升空、降落火星,并在下个发射窗口返回地球。xAI懂得将复杂任务分拆成较小的步骤,逐步思考推理,以得出更有逻辑的答案,并且容许用户实时查看其推理步骤。


在直播发表会上,Grok-3即场生成了一幅模拟火箭从地球往返火星的3D动画图。(翻摄X.com@xai的官方影片)


   xAI团队又即场指示Grok-3设计一款新游戏,要兼具俄罗斯方块(Tetris)与宝石方块(Bejeweled)的游戏特色。一般生成式AI或许会把这两款经典游戏的设计元素,硬生生塞进新作品中就了事,惟Grok-3却能真正理解两款游戏的核心机制,再将两者相互结合,创造出一款全新游戏。马斯克表示,日后xAI将成立一家AI游戏公司,在Grok的协助下要让游戏再次伟大。


Grok-3迫使对手加速研发进程


   马斯克研发Grok的野心,当然不止于游戏开发。其实,他创办xAI的主要目标,就是要了解宇宙。他扬言,假如一切顺利,SpaceX Starship将于2026年将搭载Grok与Optimus机械人,飞往火星进行探索。


   OpenAI共同创办人、计算机科学家安德烈·卡帕西(Andrej Karpathy)在试用Grok-3后表示,Grok-3 Reasoning的推理表现跟OpenAI o1-Pro相当,比起Gemini 2.0 Flash Thinking与DeepSeek-R1则略胜一筹。


Grok-3又即席创造了一款融合俄罗斯方块与宝石方块的全新游戏。(翻摄X.com@xai的官方影片)


   Grok-3展示的优异性能,将迫使竞争对手加速研发进程,推出更强大模型以应对挑战。在Grok-3发布前的数小时,OpenAI执行长山姆·奥特曼(Sam Altman)突然宣布,GPT-4.5已进入测试阶段,又表示对高要求的测试人员而言,试用GPT-4.5带来的体验远超他们预期,暗示其表现已接近通用人工智能(AGI)的境界。此举被外界解读为,奥特曼对Grok-3的狙击。


Grok-3刺激AI芯片市场增长


   再者,Grok-3的出现,亦证明了AI产业仍需要先进AI芯片提供强大运算力,有望将进一步刺激AI芯片的市场增长。xAI表示,考虑把Grok-3的运算资源扩大5倍,并已跟戴尔(Dell)洽谈价值50亿美元(约390亿港元)的服务器供货协议,预计2025年内将向xAI供应内含NVIDIA GB200芯片的服务器。


   此外,投资人开始相信,DeepSeek带来的低运算力威胁是被夸大了,近日市场上不断出现增加AI支出的新计划。欧盟委员会在2月中举行的AI行动高峰会上公布,拟投入2,000亿欧元(约1.63兆港元)来兴建AI基础设施。法国总统马克龙也宣布,未来几年将投资1,090亿欧元(约8,888亿港元)推动法国AI发展。目前英伟达(NVIDIA)股价已收复失地,差不多回升至原先价位;业界估计,AI服务器需求将持续至2025年底,对全球AI产业链形成显著的正向效应。


现时X平台用户可以免费使用Grok-3,但如却使用更高阶的AI功能,就要升级为Premium+付费订户,月费为32.92美元(约255.83港元)。(翻摄X.com@xai的官方影片)


Grok-3免费开放给所有X用户


   由是观之,Grok-3已成为吹皱一池春水的狂风,令AI竞争进入更白热化的阶段。OpenAI GPT-4.5看似箭在弦上,随时准备出击;至于Google、Anthropic、DeepSeek等,也有可能在未来几个月内释出更强大的AI模型。


   Grok-3要在新一轮AI竞赛中跑出,不能单靠强大的运算资源和优异的推理能力,胜负关键在于用户使用体验和迭代更新速度。xAI表示,Grok 3稍后会推出语音模式,让用户只需张嘴说话,即可跟AI互动;之后会开放API界面,让开发者可以将Grok-3的推理能力和语音功能,整合到自家应用软件。该公司承诺,将在几个月内公开上代Grok-2的原始码,以延续其开源策略。


   后来马斯克索性宣布,Grok-3将限时免费开放给所有X平台用户,直至服务器无法负荷为止。如此一来,X平台上逾5.85亿网民,实时变成Grok-3的使用者,让AI用户基数在短时间内得以大幅飙升,而且又可以帮助X平台吸纳更多新用户,确是一箭双雕的妙计。


   《经济通》所刊的署名及/或不署名文章,相关内容属作者个人意见,并不代表《经济通》立场,《经济通》所扮演的角色是提供一个自由言论平台。

分享:
返回智城物语
上传图片
仅支持JPG、GIF、PNG图片文件,且文件小于5M
 
评论只代表会员个人观点,不代表经济通立场 
登录 后发表评论,立即 注册 加入会员。
 (点击用户名可以查看该用户所有评论)  只看作者评论  查看全部评论:↑顺序 ↓倒序
  • 暂无读者评论!
评论只代表会员个人观点,不代表经济通观点
登录 后回复评论,立即 注册 加入会员。
发表评论 查看全部评论: ↑顺序  ↓倒序
  • 财金博客
  • 理财/管理
  • 健康人生

  • 时尚艺术
  • 吃喝玩乐
  • 全部
  • 财金博客
  • 理财/管理
  • 健康人生

  • 时尚艺术
  • 吃喝玩乐
  • 全部
more on Column 
新  一个月内新增栏目